The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models
URL:https://arxiv.org/abs/2506.06941
7 Jun 2025
組成の複雑さを精密に操作できる制御可能なパズル環境を用いて、大規模推論モデル(LRM)の根本的な能力と限界を系統的に調査しました。この研究は、最先端のLRMが特定の複雑さを超えると精度の完全な崩壊に直面すること、そして問題の複雑さが増すにつれて推論努力(思考トークン)がある点を超えると減少するという直感に反するスケーリング限界を示すことを明らかにしました。また、LRMは正確な計算に限界があり、明示的なアルゴリズムを活用できず、異なるスケールや問題間で一貫性のない推論を行うこと、さらには簡単な問題で「考えすぎ」現象を示すことも指摘しています。これらの発見は、現在の推論モデルにおける思考能力の根本的な限界を示唆しています。DeepMind論文は、思考型LLMが特定の複雑さの閾値を超えると完全に失敗するという本論文の発見を同時期の研究として言及しています。また、アリゾナ州立大学論文も、CoT推論の脆弱性に関する議論の中で、モデルが複雑なタスクで一貫性のない推論パスを生成する傾向を示す本論文を引用しています。
by NotebookLM